Instituto Politécnico Nacional
Escuela Superior de Economía
Población económicamente activa (PEA)
A partir de los 15 años en adelante en México
Noguerón Contreras Julieta Sinaí
Estadística inferencial
1
Introducción
La variable económica elegida para este trabajo fue la población económicamente activa
en México, pero ¿qué es la PEA?, Es el conjunto de personas que, en una sociedad
determinada, ejercen habitualmente una actividad económica o están en aptitud de
trabajar aunque se encuentren momentáneamente sin ocupación por causas ajenas a su
voluntad.
La PEA está constituida por los productores, es decir, por quienes desempeñan alguna
función en la actividad productiva de la sociedad o están en posibilidad de hacerlo por sus
condiciones de edad y aptitud, aunque transitoriamente carezcan de empleo.
El concepto de “persona económicamente activa” debe ser considerado en relación con la
organización del trabajo en cada sociedad. Es, por tanto, un concepto relativo que
siempre está referido a las características culturales de cada lugar.
Fuente y características
Periodicidad: Mensual
Unidad de medida: Porcentaje
Fuente: INEGI. Encuesta Nacional de Ocupación y Empleo.
Cifras preliminares a partir de: 2012/01
Nota: Para el cálculo de los indicadores de la Encuesta Nacional de
Ocupación y Empleo (ENOE), se utilizan los datos de población de las
proyecciones demográficas del CONAPO publicadas en abril de 2013.
Fecha inicial: 2012/01
Fecha final: 2017/01
2
¿Por qué?
Elegí esta variable debido a que es de suma importancia, ya que está relacionado con la
expectativa de bonanza y consolidación económica de un país.
En principio, supone que hay mayor demanda de trabajo por parte de las empresas por un
incremento general de la actividad lo que supone también mayores posibilidades
laborales para las personas con la consiguiente reducción del desempleo, un aumento del
PBI, es decir la riqueza de la nación en el período de referencia, mayor nivel de autonomía
en las decisiones microeconómicas (organizaciones) y macroeconómicas (Estado
Nacional, Provincial, Municipal).
Pero también, y es un dato no menor, puede representar a contradicción de los señalado
anteriormente, un aumento de la desocupación de los jefe de hogares o disminución de
sus salarios, por lo que familiares concurren al mercado de trabajo a buscar empleo
(efecto trabajador adicional) y recuperar o recomponer el salario familiar.
3
Estadística inferencial
UNIDAD 1 DISTRIBUCIÓN MUESTRAL
1.1 DEFINICIÓN DE ESTADÍSTICA INFERENCIAL
Estadística: es una ciencia aplicada de las matemáticas y es una valiosa herramienta para
la toma de decisiones. Permite el estudio de fenómenos mediante la descripción del
mismo a través de inferencias mediante distribuciones probabilísticas.
Se ocupa de los métodos y procedimientos para recoger, clasificar, resumir, hallar
regularidades y analizar los datos, siempre y cuando la variabilidad e incertidumbre sea
una causa intrínseca de los mismos; así como de realizar inferencias a partir de ellos, con
la finalidad de ayudar a la toma de decisiones y en su caso formular predicciones.
Objetivo: es la toma de decisiones acerca de una población con respecto de la información
que contiene una muestra.
Graficas
Presentar datos Tablas
DESCRIPTIVA media MTC
Medidas descriptivas V, DE MD o MV
ESTADISTICA Estimación de parámetros Puntual
Intervalo
INFERENCIAL “Prueba de hipótesis”
Estadística descriptiva: Describe, analiza y representa un grupo de datos utilizando
métodos numéricos y gráficos que resumen y presentan la información contenida en
ellos.
Estadística inferencial: Apoyándose en el cálculo de probabilidades y a partir de datos de
muestras, efectúa estimaciones, decisiones, predicciones u otras generalizaciones sobre
un conjunto mayor de datos.
1.1 CONCEPTOS BASICOS
Población
Muestra
Parámetros estadísticos
POBLACION.- Agregado de unidades elementales, que poseen alguna caractestica o
propiedades comunes.
4
El estudio de toda la población constituye un CENSO. Una población puede ser finita o
infinita.
En relación al tamaño de la población, ésta puede ser:
o Finita, como es el caso del número de personas que llegan al servicio de urgencia
de un hospital en un día; y se conoce el tamaño N de la población.
o Infinita, si por ejemplo estudiamos el mecanismo aleatorio que describe la
secuencia de caras y cruces obtenida en el lanzamiento repetido de una moneda
al aire.
También se considera infinita, a pesar que las poblaciones son pequeña, no se puede
saber con exactitud el tamaño de la población.
Ejemplo
- Todos los agricultores que cultivan aguacate para comercializar en México.
MUESTRA.- Es una parte de la población. Se espera que la muestra sea representativa de
la población, es decir reproduzca las caractesticas más importantes. El proceso de
obtener la muestra de denomina MUESTREO.
1.2 TIPOS DE MUESTREO
MUESTRA -> RAZONES: tiempo, costo, pob.infinita, disponibilidad de elementos, error en
aumento, naturaleza del producto del que se esté hablando.
Juicio
NO PROBABILISTICO cuota
Convivencia
TIPOS DE MUESTREO Bola de nieve
Aleatoria Simple
PROBABILISTICO Sistematizada
Estratificado
Conglomerados
Existen diferentes criterios de clasificación de los diferentes tipos de muestreo, aunque en
general pueden dividirse en dos grandes grupos: métodos de muestreo probabilísticos y
métodos de muestreo no probabilísticos.
I. Métodos de muestreo no probabilísticos
5
En general se seleccionan a los sujetos siguiendo determinados criterios procurando, en
la medida de lo posible, que la muestra sea representativa. En algunas circunstancias los
métodos estadísticos y epidemiológicos permiten resolver los problemas de
representatividad aun en situaciones de muestreo no probabilístico, por ejemplo los
estudios de caso-control, donde los casos no son seleccionados aleatoriamente de la
población.
Entre los métodos de muestreo no probabilísticos más utilizados en investigación
encontramos:
1.- Muestreo por cuotas: También denominado en ocasiones "accidental". Se asienta
generalmente sobre la base de un buen conocimiento de los estratos de la población y/o
de los individuos más "representativos" o "adecuados" para los fines de la investigación.
Mantiene, por tanto, semejanzas con el muestreo aleatorio estratificado, pero no tiene el
carácter de aleatoriedad de aquél.
Ejemplo: Si se quiere hacer una encuesta en la ESE, el coordinador elige a 9 personas para
la recolección de datos, dividiéndose por semestre.
2.- Muestreo intencional o de conveniencia: Este tipo de muestreo se caracteriza por un
esfuerzo deliberado de obtener muestras "representativas" mediante la inclusión en la
muestra de grupos supuestamente típicos. Es muy frecuente su utilización en sondeos
preelectorales de zonas que en anteriores votaciones han marcado tendencias de voto.
Ejemplo: En las degustaciones, la persona visualmente elige al comensal
3.- Bola de nieve: Se localiza a algunos individuos, los cuales conducen a otros, y estos a
otros, y así hasta conseguir una muestra suficiente. Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones "marginales", delincuentes,
sectas, determinados tipos de enfermos, etc.
Ejemplo: Cuando ocurrió el caso de la influenza, en la ESE, un alumno compartió su
botella con los demás y poco a poco se enfermaron
4.- Muestreo de juicio: A criterio del investigador los elementos son elegidos sobre lo que
él cree que pueden aportar al estudio.
Ejemplo: Al recomendarte 3 películas de 18, es más fácil al momento de elegir
II. Muestreo probabilístico Los métodos de muestreo probabilísticos son aquellos que se
basan en el principio de equiprobabilidad. Es decir, aquellos en los que todos los
individuos tienen la misma probabilidad de ser elegidos para formar parte de una muestra
y, consiguientemente, todas las posibles muestras de tamaño n tienen la misma
probabilidad de ser seleccionadas.
6
Tipos:
1.- Muestreo aleatorio simple: El procedimiento empleado es el siguiente:
1) se asigna un número a cada individuo de la población y
2) a través de algún medio mecánico (bolas dentro de una bolsa, tablas de números
aleatorios, números aleatorios generadas con una calculadora u ordenador, etc.) se eligen
tantos sujetos como sea necesario para completar el tamaño de muestra requerido.
P(x)= 1/N
2.- Muestreo aleatorio sistemático: Este procedimiento exige, numerar todos los
elementos de la población, pero en lugar de extraer n números aleatorios sólo se extrae
uno.
Se parte de ese número aleatorio i, que es un número elegido al azar, y los elementos
que integran la muestra son los que ocupa los lugares i, i+k, i+2k, i+3k,...,i+(n-1)k, es decir
se toman los individuos de k en k, siendo k el resultado de dividir el tamaño de la
población entre el tamaño de la muestra: k= N/n.
3.- Muestreo aleatorio estratificado: Consiste en considerar categorías típicas diferentes
entre sí (estratos) que poseen gran homogeneidad respecto a alguna característica (se
puede estratificar, por ejemplo, según la profesión, el municipio de residencia, el sexo, el
estado civil, etc.). Lo que se pretende con este tipo de muestreo es asegurarse de que
todos los estratos de interés estarán representados adecuadamente en la muestra.
Tipos:
Afijación Simple: A cada estrato le corresponde igual número de elementos muéstrales.
Afijación Proporcional: La distribución se hace de acuerdo con el peso (tamo) de la
población en cada estrato.
Afijación Óptima: Se tiene en cuenta la previsible dispersión de los resultados, de modo
que se considera la proporción y la desviación típica. Tiene poca aplicación ya que no se
suele conocer la desviación.
4.- Muestreo aleatorio por conglomerados: En el muestreo por conglomerados la unidad
muestral es un grupo de elementos de la población que forman una unidad, a la que
llamamos conglomerado. Las unidades hospitalarias, los departamentos universitarios,
una caja de determinado producto, etc., son conglomerados naturales. En otras ocasiones
se pueden utilizar conglomerados no naturales como, por ejemplo, las urnas electorales.
Cuando los conglomerados son áreas geográficas suele hablarse de "muestreo por
áreas".
7
Error de muestreo
Es la desviación de la muestra seleccionada de las verdaderas características, rasgos,
comportamientos, cualidades o figuras de toda la población.
ESTIMACIÓN DE UNA MEDIA Y VARIANZA EN UNA MUESTRA ALEATORIA
FORMULAS:
MEDIA =
𝑋𝑖
𝑛
Dónde: Xi = cada elemento
n= tamaño muestra
VARIANZA S
2=
∑(Xi- )
2
n-1
Dónde: = media
Xi= cada elemento
n= tamaño de muestra
LIMITE PARA ERROR 2√V(X)= √S
2
/n ((N-n)/N)
Dónde: S
2
= varianza
n = tamaño de la muestra
N= tamaño de la población
Se entrevistan a 300 personas económicamente activas sobre la cantidad de dinero que
gastan al día, tomando una muestra aleatoria de 5 personas, obteniendo los siguientes
datos: X1=$70, X2=$120, X3=$85, X4=$97, X5=$108.Determinar:
Xi
(Xi- )
(Xi- )
2
70
-26
676
120
24
576
85
-11
121
97
1
1
108
12
144
∑480
1518
La media
=480/5=96
Varianza
S
2
=1518/4=379.5
Límite para el error
2√(379.5/5)((300-5)/300)= 17.24
8
CONCLUSIÓN:
En promedio los 300 entrevistados gastan al día $96 existiendo un error de $17.24 más o
menos de los $96
ESTIMACIÓN DE UNA MEDIA Y VARIANZA EN UNA MUESTRA SISTEMATIZADA
Un empleado (PEA) de la empresa Coca-Cola e utiliza el muestreo sistematizado para
estimar la cantidad promedio es que es llenada una botella de Coca-Cola de 500 ml que
salen de la línea de producción. Los datos siguientes representan K= 70 de la producción
de un día. Determinar media y error de estimación suponiendo que N= 700 y n= 10
Xi
(Xi- )
(Xi- )
2
500
0.05
0.0025
499.75
-0.2
0.04
499.99
0.04
0.0016
500.01
0.06
0.0036
499.91
-0.04
0.0016
499.99
0.04
0.0016
499.87
-0.08
0.0064
499.97
0.02
0.0004
500.05
0.1
0.01
500
0.05
0.0025
4999.54
0.0702
=4999.54/10=499.95
S
2
=0.0702/9=0.0078
2√(0.0078/10)((700-10)/700)= 0.0007644
CONCLUSIÓN: En promedio se llena con 499.95 con un error de 0.0007644
ESTIMACIÓN DE UNA MEDIA Y VARIANZA EN UNA MUESTRA ESTRATIFICADA
Por estrato: =∑Xi S
2
=∑(Xi- )
n n-1
Media estratificada: est=1 (N1 1+ N2 2+…+Nn n)
N
9
Varianza estratificada: S
2
est=1∑Ni
2
[Ni-ni][Si
2
]
N
2
Ni ni
Límite para error: 2√v( est)=2√ 1∑Ni2[Ni-ni][Si
2
]
N
2
Ni ni
Se entrevista a la población económicamente activa de Tláhuac sobre la cantidad de
horas que están al frente de un computador al día, de este población se va a estratificar
en dos zonas, la A con la cantidad de 100 personas económicamente activas y el B con
110 personas económicamente activas. Determinar la media, varianza y límite para el
error. Los resultados de las encuestas considerando una n=15 tomando de estrato
muestras de tamaño nA= 8 y nB= 7 son las siguientes:
A= 8, 6, 4, 9, 7, 2, 6, 7
B=1, 2, 3, 4, 5, 6, 7
Xi
(Xi- )
(Xi- )
2
8
1.63
2.6569
6
-0.37
0.1369
4
-2.37
5.6169
9
2.63
6.9169
7
0.63
0.3969
3
-3.37
11.3569
6
-0.37
0.1369
8
1.63
2.6569
51
29.8752
=51/8=6.37
S2=29.87/7=4.26
N= 100
N=8
Xi
(Xi- )
(Xi- )
2
1
-3
9
2
-2
4
10
3
-1
1
4
0
0
5
1
1
6
2
4
7
3
9
28
28
=28/7=4
S2=28/6=4.66
N= 110
N=7
Estrato A
Estrato B
N
100
110
n
8
7
6.37
4
S
2
4.26
4.66
est=(1/210)(100(6.37)+110(4))=0.0047(1077)=5.06
S
2
est=( 0.000022)(10000(0.92))(4.26/8)+(12100(0.93))(4.66/7)=
(0.000022)((9200) (0.5325)+ (11253) (0.6657))=12390.12
(0.000022)=0.2725
Lim error= 2√0.2725=1.0440
Los PEA en promedio de 210, están al frente de la computadora 5 horas al dia, con un
error de 1 hora
ESTIMACIÓN DE UNA MEDIA Y VARIANZA EN UNA MUESTRA POR CONGLOMERADOS
Media: =∑Xi
∑mi
Varianza: S
2
= [N-n] [∑ (Xi- m)
2
]
Nnµ
2
n-1
11
Limite error: 2√v ( con)=2√S
2
Excélsior desea estimar el salario mensual promedio de la población económicamente
activa, en la CDMX. Se relacionan 3 000 personas organizadas en 500 conglomerados de
manera geográfica de 4 personas cada uno. Se selecciona una muestra aleatoria de 2
conglomerados obteniendo los siguientes datos:
Conglomerado Salarios en miles
1 9,8,3,6
2 9,3,4,6
Conglomerado
(Xi- mi)
2
1
4
2
4
8
=48/8=6
mi=24
S
2
con=0.11
µ=M/N= 3000/500=6
2√0.11=0.66
En promedio un PEA gana mensualmente 6 mil pesos con un error de 660 pesos.
1.3 INTRODUCCIÓN A DISTRIBUCIONES MUESTRALES
1.4 DISTRIBUCIONES MUESTRALES
Al obtener una población con un tamaño “N”, muestras de tamaño “n” el número de
muestras será diferente. Si el muestreo se hace con reemplazo o si él.
Ejemplo:
Si se tienen los siguientes elementos: W, X, Y, Z. La muestra puede seleccionarse de dos
formas:
MUESTREO CON REEMPLAZO: CUALQUIER ELEMENTO TIENE LA POSIBILIDAD DE
REPETIRSE EN LA MISMA MUESTRA
Formula: N
n
4
2
= 16
N= 4
12
N=2
MUESTREO SIN REEMPLAZO: c/elemento solo puede ser seleccionado una vez
Formula:
N
C
n
= N!__
n!(N-n)!
4
C
2
=10
1.5 DISTRIBUCION MUESTRAL DE LA MEDIA MUESTRAL
1.4.1 DISTRIBUCIÓN MUESTRAL DE LA VARIANZA MUESTRAL
DISTRIBUCIÓN DE MUESTREO DE MEDIAS
Es una distribución probabilística que consta de todas las medias muéstrales posibles de
un tamaño de muestra dado, de una población la probabilidad de ocurrencia de c/media
muestral:
Media: =∑Xi
Nm
Varianza: σ
2
= ∑ (Xi-µ )
2
Nm
Lim error: σ
= √
σ
2
Ejercicio: De una población de 4 personas económicamente activas tienen las siguientes
edades: 20, 22, 24,26. Determinar media y varianza para:
a) Una muestra con reemplazo de 2 elementos
N=4
N=2
4
2
=16
No.
combinación
Xi
Xi
(Xi-µ )
2
1
20,20
20
-3
9
2
20,22
21
-2
4
3
20,24
22
-1
1
4
20,26
23
0
0
5
22,20
21
-2
4
6
22,22
22
-1
1
7
22,24
23
0
0
8
22,26
24
1
1
9
24,20
22
-1
1
10
24,22
23
0
0
11
24,24
24
1
1
12
24,26
25
2
4
13
13
26,20
23
0
0
14
26,22
24
1
1
15
26,24
25
2
4
16
26,26
26
3
9
368
40
µ =368/16=23
σ
2
=40/16=2.5
σ =√2.5=1.58
b) Una muestra sin reemplazo de 2 elementos
No.
combinación
Xi
Xi
(Xi-µ )
2
1
20,22
21
-2
4
2
20,24
22
-1
1
3
20,26
23
0
0
4
22,24
23
0
0
5
22,26
24
1
1
6
24,26
25
2
4
138
10
µ =138/6=23
σ
2
=10/6=1.66
σ =√1.6=1.28
Cuando los parámetros de la población son conociendo el valor esperado y el erro
estándar de la distribución de muestreo de la media se calcula:
VALOR ESPERADO:
E(X)= µ
µ= ∑Xi
N
σ
2
= (Xi-µ)
2
N
σ=√ σ
2
El error estándar para una población infinita con reemplazo es:
σ
=
σ/√n Sin n<0.05N
El error estándar para una población finita sin reemplazo es:
14
σ
=
σ/√n(√(N-n/N-1)) Sin n>0.05N
La forma de la distribución de muestreo de los medios tiende a ser más acampanada
en relación a la distribución de los valores de la población. A esto se le conoce como
teorema de límite central.
De la población, determina la media, varianza y error estándar
Edad
Xi
(Xi-µ)
2
20
-3
9
22
-1
1
24
1
1
26
3
9
92
20
µ=92/4=23
σ2=20/4=5
σ=√5=2.23
POBLACION INFINITA σ =1.58
POBLACION FINITA σ =1.10
edades
frecuencia
probabilidad
20
1
¼ = 0.25
22
1
¼ = 0.25
24
1
¼ = 0.25
26
1
¼ = 0.25
4
1
edades
frecuencia
probabilidad
21
1
1/6=0.16
22
1
1/6=0.16
23
2
2/6=0.33
24
1
1/6=0.16
25
1
1/6=0.16
6
1
0
0.1
0.2
0.3
0 5 10 15 20 25 30
Con reemplazo
15
1.4.3 TEOREMA DE LIMITE CENTRAL
Cuando las muestras no provienen de una población normal el tamaño es
importante. Cuando n es pequeña la forma de distribución depende de la población y
cuando n crece uno de los teoremas de la inferencia estadística establece que la
forma de la distribución muestral se parece cada vez más a una distribución normal.
TEORENA DE LC
Si es una media de una muestra tamaño n, la cual es tomada de una población con
media µ y varianza finita entonces el límite de distribución es:
Z=
σ/√n
Conforme n crece se asemeja a la distribución normal, es decir (z,U,1)
OBSERVACIONES:
1.-La proximación normal para generalmente será bueno si n≥30 sin importar la
forma de la población.
2.- Si la población no es normal, la distribución de los valores medidos de la muestra
será aproximadamente normal respecto a un tamaño muestral grande.
3.- Si una población tiene una distribución con µ y desviación estándar σ entonces
cuando n crece la distribución de las medias muéstrales se aproxima a la curva
normal con:
E(X)= µ
σ
=
σ/√n Sin n<5%N
σ
=
σ/√n(√(N-n/N-1)) Sin n>5% N
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0 5 10 15 20 25 30
Sin reemplazo
16
4.- El teorema nos permite inferir parámetros poblacionales a partir de estadísticos
muéstrales poblacionales sin que se conozcan la forma de la distribución.
5.-La distribución normal estándar para una distribución muestral de medias es:
Z= -> Z=
σ/√n
EJERCICIO:
De una población económicamente activa en Xochimilco, se quiere saber cuál es el
monto que pagan por el uso de la luz bimestralmente, de acuerdo con la población el
pago mensual es de 100 con una desviación estándar de 10.01. Se toma una muestra
aleatoria de 10, si se sabe que la población es de 500, ¿Cuál es la probabilidad de que
el pago sea menor de $95?
N=500
n= 10
µ = 100
i=95
σ
2
=10.01
Z= (95-100)/3.16=-1.5822
Valor en tabla: 0.44295
Respuesta: .5-0.44295=0.05
0
0.5
1
1.5
2
2.5
0 0.5 1 1.5 2 2.5 3 3.5
100
µ
1σ
2σ
3σ
0.44295
0.05
17
1.4.4 DISTRIBUCION MUESTRAL DE LA MEDIA MUESTRAL CUANDO LA VARIANZA ES
DESCONOCIDA
Se sabe que cuando x es normal, su distribución es:
Z=
σ/√n
Pero qué ocurre si la varianza poblacional se desconoce ¿σ? .Esta se sustituye por la
desviación estándar de muestras
t=
s/√n
DISTRIBUCION DE T DE STUDENT
SU CARACTERISTICA PRINCIPAL SE DETERMINA EN RELACION AL TAMAÑO DE LA MUESTRA
MENOS UNO.
*Grados de libertad: se refiere al número de valores que están libres para variar después
de haber impuesto ciertas restricciones a nuestros datos. Es decir, representa una medida
del número de observaciones independientes en la muestra que pueden usarse para
estimar la desviación estándar.
La t de student es el estadístico apropiado en la inferencia, acerca de la media
poblacional, cuando las muestras son pequeñas:
n-1=gl
CARACTERISTICAS:
*Es una distribución continua
*es acampanada y simétrica
*tiene una media igual a 0 pero sus observaciones estándar difieren de acuerdo al
tamaño de la muestra
*es más extendida y menos aguda en el centro, que a distribución normal
* A medida que aumenta el tamaño de la muestra, se acerca hacia la distribución normal
(TLC)
1.4.5 DISTRIBUCIÓN MUESTRAL DE LA VARIANZA CUANDO LA POBLACIÓN ES NORMAL
La varianza muestral es un estadístico de la varianza poblacional. La distribución de las
varianzas muéstrales generada mediante muestreo repetitivo, tendrá una distribución de
18
probabilidad que empieza en 0, por lo tanto su forma depende de la distribución de
probabilidad de la población
Se considera que la muestra proviene de una población normal y el único parámetro es l
letra r, es decir grados de libertas
r= gl= n-1
Esta nueva variable se representa así X
2
X
2
= (rS
2
)
σ
2
CARACTERISTICAS:
Existe una distribución unimodal sesgada a la derecha porque los valores son siempre
positivos.
El número de grados de libertad determina la forma. Cuando r es pequeña, su forma es
sesgada hacia a derecha, sin embargo cuando r crece la distribución adquiere una forma
más simétrica.
El valor de la X2 NO SE PUEDE tomar valores inferiores a 0
Se extiende de 0 a infinito
1.4.6 DISTRIBUCIÓN MUESTRAL DEL COEFICIENTE DE VARIANZA
Cuando se desea probar si 2 poblaciones independientes tienen la misma variabilidad se
utiliza una prueba estadística basada en la razón de Z varianzas muéstrales.
A esta distribución se le conoce como F en honor al matemático Fisher:
F= S
1
2
S
2
2
CARACTERISTICAS:
1. existe una distribución muestral f para cada combinación de tamo de muestra.
2. Es una distribución continua que va de 0 a infinito
3. No pueden existir valores negativos
4. Tanto el numerador como el denominador tienen grados de libertad
F= S
1
2
S
2
2
z
F r, r
2
inferior =___ 1____
F r, r
2
inferior
19
UNIDAD II
2.1 ESTIMADORES Y PARAMETROS
2.1.1 DEFINICION DE ESTIMACION
Conjunto de técnicas que permiten dar un valor aproximado de un parámetro de una
población a partir de los datos proporcionados por una muestra. Por ejemplo, una
estimación de la media de una determinada característica de una población de tamaño N
podría ser la media de esa misma característica para una muestra de tamaño n.
2.1.2 ESTIMACIÓN PUNTUAL
Una estimación puntual del valor de un parámetro poblacional desconocido (como puede
ser la media µ, o la desviación estándar σ), es un número que se utiliza para aproximar el
verdadero valor de dicho parámetro poblacional. A fin de realizar tal estimación,
tomaremos una muestra de la población y calcularemos el parámetro muestral asociado
(x para la media, s para la desviación estándar, etc.). El valor de este parámetro muestral
será la estimación puntual del parámetro poblacional.
Por ejemplo, supongamos que la compañía Sony desea estimar la edad media de los
compradores de equipos de alta fidelidad. Seleccionan una muestra de 100 compradores
y calculan la media de esta muestra, este valor será un estimador puntual de la media de
la población.
2.2 PROPIEDADES DE UN BUEN ESTIMADOR
EFICIENCIA:
Un estimador es más eficiente o preciso que otro, si la varianza del primero es menor que
la del segundo.
CONVERGENCIA:
Para estudiar las características de un estimador no solo basta con saber el sesgo y la
varianza, sino que además es útil hacer un análisis de su comportamiento y estabilidad en
el largo plazo, esto es, su comportamiento asintótico. Cuando hablamos de estabilidad en
largo plazo, se viene a la mente el concepto de convergencia. Luego, podemos construir
sucesiones de estimadores y estudiar el fenómeno de la convergencia.
Comportamiento Asintótico: En el caso de las variables aleatorias, existen diversos tipos
de convergencia, dentro de las cuales podemos distinguir:
-Convergencia en probabilidad (o débil).
-Convergencia casi segura (o fuerte).
-Convergencia en media cuadrática.
-Convergencia en distribución.
CONSISTENCIA:
También llamada robustez, se utilizan cuando no es posible emplear estimadores de
mínima varianza, el requisito mínimo deseable para un estimador es que a medida que el
20
tamaño de la muestra crece, el valor del estimador tiende a ser el valor del parámetro,
propiedad que se denomina consistencia.
SUFICIENCIA:
Un estimador ˆ es suficiente cuando no da lugar a una pérdida de información. Es decir,
cuando la información basada en ˆ es tan buena como la que hiciera uso de toda la
muestra.
2.2.1 ESPERANZA Y VARIANZA DE UN ESTIMADOR
µ= = ∑Xi/n
σ
2
=S
2
= ∑ (Xi- )
2
/(n-1)
σ =S= √ S
2
EJEMPLO
El ejecutivo de la empresa Samsung está interesado en conocer las utilidades anuales
que ha obtenido su gama celular, para así poder obtener un promedio de ganancia. Las
utilidades de los 5 productos celulares más demandados son los siguientes:
No.
Producto
Utilidad
Xi-
(Xi- )
2
1
Samsung S8
10404
-51893.6
2692945721
2
Samsung Galaxy J7
96803
34505.4
1190622629
3
Galaxy Grand Prime Plus
40056
-22241.6
494688770.6
4
Galaxy A5
67422
5124.4
26259475.36
5
Galaxy S8+
96803
34505.4
1190622629
Suma
311488
5595139225
=311488/5= 62297.6 Ganancias promedio.
S
2
= 5595139225/4= 1398784806
S=√ 1398784806= 37400.33163 Variabilidad.
2.2 SESGO DE UN ESTIMADOR
Se denomina sesgo de un estimador a la diferencia entre la esperanza (o valor esperado)
del estimador y el verdadero valor del parámetro a estimar. Es deseable que un
estimador sea insesgado o centrado, es decir, que su sesgo sea nulo por ser su esperanza
igual al parámetro que se desea estimar.
Por ejemplo, si se desea estimar la media de una población, la media aritmética de la
muestra es un estimador insesgado de la misma, ya que su esperanza (valor esperado) es
igual a la media de la población.
Se dice que un estimador es insesgado si la Media de la distribución del estimador es igual
al parámetro.
Estimadores insesgados son la Media muestral (estimador de la Media de la población) y
la Varianza (estimador de la Varianza de la población):
21
Ejemplo
En una población de 500 puntuaciones cuya Media (m) es igual a 5.09 han hecho un
muestreo aleatorio (número de muestras= 10000, tamaño de las muestras= 100) y
hallan que la Media de las Medias muéstrales es igual a 5.09, (la media poblacional y la
media de las medias muéstrales coinciden). En cambio, la Mediana de la población es
igual a 5 y la Media de las Medianas es igual a 5.1 esto es, hay diferencia ya que la
Mediana es un estimador sesgado.
La Varianza es un estimador sesgado. Ejemplo: La Media de las Varianzas obtenidas con
la Varianza
En un muestreo de 1000 muestras (n=25) en que la Varianza de la población es igual
a 9.56 ha resultado igual a 9.12, esto es, no coinciden. En cambio, al utilizar la
Cuasivarianza
La Media de las Varianzas muéstrales es igual a 9.5, esto es, coincide con la Varianza de la
población ya que la Cuasivarianza es un estimador insesgado.
ERROR CUADRATICO MEDIO
Otro criterio razonable para escoger un determinado estimador de un parámetro θ es
tomar aquel que cometa, en promedio, el menor error en la estimación. Como, en
principio, queremos penalizar igualmente los errores por defecto que por exceso
podríamos establecer como cantidad a minimizar la esperanza de la diferencia entre el
estadístico T y el parámetro θ (en valor absoluto para impedir que los errores por defecto
y por exceso se anulen mutuamente):
Aunque este operador resulta razonable, presenta el inconveniente de que la función
valor absoluto es complicada de manejar desde un punto de vista matemático. Por dicha
razón suele utilizarse el error cuadrático medio (ECM) de un estimador T, definido como
sigue:
Una propiedad interesante del ECM es que puede descomponerse como la suma de dos
componentes: la varianza del estimador más su sesgo al cuadrado:
22
Por tanto, en el caso de comparar diversos estimadores centrados de un parámetro θ, el
ECM coincidirá con sus varianzas. Con lo que el estimador con menor ECM coincidirá con el
de menor varianza.
Debe quedar claro, sin embargo, que el estimador con menor ECM no debe ser
necesariamente centrado. De hecho, no siempre existirá el estimador con ECM mínimo. En
realidad, si no nos restringimos a estimadores centrados, suele suceder que para unos
determinados valores de θ sea un estimador el que produzca un ECM menor, mientras
que para otros valores de θ sea otro estimador el que obtenga un ECM menor.
ESTIMACIONES EFICIENTES. EFICIENCIA RELATIVA
Eficiencia Relativa: La eficiencia relativa entre dos estimadores y de un
parámetro θ, con ECM respectivos se define como:
Si la eficiencia relativa es menor que 1 entonces concluimos que es un mejor
estimador de θ que
estimadores insesgados de θ, entonces:
Si y son dos
Si consideramos todos los posibles estimadores insesgados de algún parámetro θ, el de
menor varianza se llama Estimador más Eficiente de θ.
EFICIENCIA Y CONSISTENCIA DE UN BUEN ESTIMADOR
CONSISTENCIA:
También llamada robustez, se utilizan cuando no es posible emplear estimadores de
mínima varianza, el requisito mínimo deseable para un estimador es que a medida que el
tamaño de la muestra crece, el valor del estimador tiende a ser el valor del parámetro,
propiedad que se denomina consistencia.
EFICIENCIA:
Un estimador es más eficiente o preciso que otro, si la varianza del primero es menor que
la del segundo.